Day12 - 可觀察性的演進史：從控制理論到重新定義

15th鐵人賽可觀測性

Marcus

2023-09-27 05:41:35

844 瀏覽

分享至

鐵人賽 Day12 - 可觀察性的演進史：從控制理論到重新定義

大家好，我是伐伐伐伐木工

今天要與大家分享關於可觀測性過去幾年是如何不斷演進與重新定義的歷程

演進史

1960：可觀測性和控制理論

在技術領域，可觀測性一詞起源於控制理論，這是動態工程和機械系統的數學領域
在系統中，可觀測性是衡量系統內部狀態可以從外部輸出的知識推斷出來的程度的指標。
魯道夫·E·卡爾曼 (Rudolf E. Kálmán) 引入了該術語來描述系統可以透過其產出來衡量的程度。

2013：Twitter 可觀測團隊描述其使命

2013.9 : Twitter 的工程師撰寫了一篇名為Twitter 的可觀察性的部落格文章，「可觀察性」一詞首次在 IT 系統中登場，內文如下

Twitter 的工程師需要確定其服務的性能特徵、對上游和下游服務的影響，並在服務未按預期運行時收到通知。
可觀察性團隊的使命是利用我們用於收集、儲存和呈現指標的統一平台來分析此類問題。解釋了如何「捕獲、儲存、查詢、視覺化和自動化整個過程」

2016：Twitter 可觀察性的（四個）支柱

Twitter 可觀測性工程團隊的 Anthony Asta創建了一篇名為Twitter 可觀測性：技術概述，第一部分的部落格文章。

Twitter 的可觀測性工程團隊為我們的內部工程團隊提供全端程式庫和多種服務，以監控服務運作狀況、發出問題警報、透過提供分散式系統呼叫追蹤來支援根本原因調查，並通過創建聚合應用程序/系統日誌的可搜尋索引。

其中概述了他們團隊章程的四大支柱
- 監控
- 警報/可視化
- 分散式系統追蹤基礎設施
- 日誌聚合/分析

2017：可觀察性的三大支柱

2017.2 : Peter Bourgon 出席2017分散式追蹤高峰會。他參與了關於追蹤如何幫助提供可觀察性的定義和範圍的討論
在一篇名為「指標、追蹤和日誌記錄」的部落格文章中，他描述了他認為他們如何可能將儀器或可觀察性領域繪製成一種維恩圖

2018：可觀測年

可觀察性以及日誌記錄、指標和追蹤三大支柱成為主流對話的一部分。
2018.6，Humio 執行長 Geeta Schmidt在一篇名為《數據驅動的可觀察性和日誌》的Medium 文章中加入了她的想法。

僅僅擁有用於日誌管理、指標和追蹤的工具並不足以從中獲得價值。她堅持認為需要進行文化轉變，重視事實和回饋，在調試過程中以數據為驅動。並利用這種思維方式來迭代、改進和解決問題。

2018.7，Cindy Sridharan為 O'Reilly 出版了一本權威書籍 《分散式系統可觀察性》。本書概述了可觀察性的三大支柱，並詳細介紹了使用哪些工具以及何時使用。
2018 年底，可觀測三大支柱模式開始出現裂痕。
2018.9 Honeycomb 技術長 Charity Majors 警告稱

可觀察性描述為三大支柱限制了討論。大膽地感嘆“可觀測性不存在三大支柱”，並補充道，“事實上，每個人都在盲目地重複這個口頭禪（以及貨物崇拜這些原語），這可能就是為什麼我們的可觀測性工具落後了10 年。
”我們軟體工具鏈的其餘部分。” 她進一步指出：「事件是程式碼通過系統的執行路徑。這是從內到外了解您的系統的正確視角。”

許多業內人士注意到了這一點，並開始考慮除了三大支柱之外的可觀察性。

2019：激烈辯論隨之而來

隨著越來越多人重視與實際導入，可觀測性議題開始慢慢浮現

當公司購買並部署工具來從三個支柱中收集數據時，他們發現他們可以存取更多的系統數據，但他們仍然沒有實現基礎設施的 100% 可觀察性。
事實證明，承諾可觀察性的工具無法處理來自 TB 級非結構化資料的資料量。工程師必須限制他們保留的數據，以保持在昂貴的許可證所限制的範圍內。他們發現他們使用的工具太慢，因為索引延遲和其他問題導致即時觀察變得不可能。而且新系統過於複雜，部署困難、維護不切實際且成本高、介面不一致、難學、難用。

整個產業的技術領導者加入了重新定義可觀察性的對話。

2019.2，LightStep 執行長兼聯合創始人Ben Sigelman發表了一篇名為《零答案的三大支柱：可觀察性的新記分卡》的部落格文章。